{
 "cells": [
  {
   "cell_type": "markdown",
   "metadata": {},
   "source": [
    "# 第二章.描述统计学--理论"
   ]
  },
  {
   "cell_type": "markdown",
   "metadata": {},
   "source": [
    "<p>本章节主要回答以下问题</p>\n",
    "<ul>\n",
    "    <li>一.用统计量描述数据?</li>\n",
    "    <li>二.用表格描述数据?</li>\n",
    "    <li>三.用图像来描述数据?</li>\n",
    "</ul>"
   ]
  },
  {
   "cell_type": "markdown",
   "metadata": {},
   "source": [
    "## 2.1用统计量描述数据?"
   ]
  },
  {
   "cell_type": "markdown",
   "metadata": {},
   "source": [
    "<p>用统计量描述数据,包含以下三部分:①数据集中趋势度量,②数据离散趋势度量,③数据分布形状的度量</p>"
   ]
  },
  {
   "cell_type": "markdown",
   "metadata": {},
   "source": [
    "### 2.1.1.数据集中趋势的度量.\n"
   ]
  },
  {
   "cell_type": "markdown",
   "metadata": {},
   "source": [
    "<P>数据集中趋势是指一组数据集中于某一中心的水平位置。测度集中趋势也是寻找数据一般水平的中心值或代表值</P>\n",
    "<P>测试集中趋势的方法有:平均数,中位数,众数,计算百分比，分位数</P>\n",
    "<p>顺序数据集中趋势的常用方法:计算百分比,中位数,众数</p>\n",
    "<p>分类数据集中趋势的常用方法:众数</p>\n",
    "<p>数值型数据集中趋势常用方法:平均数,中位数,四分位数,众数</p>"
   ]
  },
  {
   "cell_type": "markdown",
   "metadata": {},
   "source": [
    "> 值得注意的是:平均数,中位数,众数是描述数据水平的三个主要统计量.由于平均值易受极端值的影响,所以当数据为<strong>偏态分布且倾斜\n",
    "    程度比较大时,使用众数或中位数做集中趋势的度量</strong>"
   ]
  },
  {
   "cell_type": "markdown",
   "metadata": {},
   "source": [
    "> 特别地.当数据呈<strong>左偏分布</strong>时(即左边数据量大于右边数据量时).有众数>中位数>平均数.<br>\n",
    "    当数据呈<strong>右偏分布</strong>时.有众数<中位数<平均数"
   ]
  },
  {
   "cell_type": "markdown",
   "metadata": {},
   "source": [
    "### 2.1.2.数据离散趋势的度量"
   ]
  },
  {
   "cell_type": "markdown",
   "metadata": {},
   "source": [
    "<p>数据离散趋势的度量主要是指数据离心趋势的度量或离散程度的度量</p>\n",
    "<p>常用的离散趋势度量指标</p>\n",
    "<ul>\n",
    "    <li>异众比率:是指非众数组的频数占总频数的比率.计算公式:Vr=1-(f \\ $\\sum$ fi)</li>\n",
    "    <li>方差</li>\n",
    "    <li>标准差</li>\n",
    "    <li>四分位差(上分位数-下分位数)</li>\n",
    "    <li>极差</li>\n",
    "    <li>离散系数or变异系数(标准差除以均值)</li>\n",
    "    <li>标准分数:它是变量值与均值的离差除以标准差后的值。用以测量某一个数据在改组数据中的相对位置</li>\n",
    "</ul>"
   ]
  },
  {
   "cell_type": "markdown",
   "metadata": {},
   "source": []
  },
  {
   "cell_type": "markdown",
   "metadata": {},
   "source": [
    "### 2.1.3.数据分布形状的度量?"
   ]
  },
  {
   "cell_type": "markdown",
   "metadata": {},
   "source": [
    "> 数据的不对称性称位偏态.偏度系数越大，表示数据的偏斜程度越大。当SK>0时.表示右偏。当SK<0.表示左偏\n"
   ]
  },
  {
   "cell_type": "markdown",
   "metadata": {},
   "source": [
    "> 如果数据服从标准正态则峰态为0.如果峰态大于0则为尖峰分布,如果峰态小于0则为扁平分布"
   ]
  },
  {
   "cell_type": "markdown",
   "metadata": {},
   "source": [
    "## 2.2.用表格描述数据"
   ]
  },
  {
   "cell_type": "markdown",
   "metadata": {},
   "source": [
    "<ul>\n",
    "    <li>数值型数据的频数分布表</li>\n",
    "    <li>非数值型数据的频数分布表</li>\n",
    "</ul>"
   ]
  },
  {
   "cell_type": "markdown",
   "metadata": {},
   "source": [
    "## 2.3用图形描述数据"
   ]
  },
  {
   "cell_type": "markdown",
   "metadata": {},
   "source": [
    "> 常用来描述数值型数据的统计图形有:直方图,箱型图,折线图,气泡图,雷达图"
   ]
  },
  {
   "cell_type": "markdown",
   "metadata": {},
   "source": [
    "> 非数值型数据有饼图,条形图,环形图,帕累托图"
   ]
  },
  {
   "cell_type": "markdown",
   "metadata": {},
   "source": [
    "图形的绘制请关注本章节的实践部分"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": null,
   "metadata": {},
   "outputs": [],
   "source": []
  }
 ],
 "metadata": {
  "kernelspec": {
   "display_name": "Python 3",
   "language": "python",
   "name": "python3"
  },
  "language_info": {
   "codemirror_mode": {
    "name": "ipython",
    "version": 3
   },
   "file_extension": ".py",
   "mimetype": "text/x-python",
   "name": "python",
   "nbconvert_exporter": "python",
   "pygments_lexer": "ipython3",
   "version": "3.8.3"
  }
 },
 "nbformat": 4,
 "nbformat_minor": 4
}
